OpenAI o1是真有实力!港大权威AB测试,国家队奥数题照样拿下
OpenAI o1是真有实力!港大权威AB测试,国家队奥数题照样拿下OpenAI o1的数学推理能力是否真的那么强?近日,来自港大的研究人员对模型进行了严格的AB测试,在非公开的国家队奥数题面前,o1证明了自己的实力。
OpenAI o1的数学推理能力是否真的那么强?近日,来自港大的研究人员对模型进行了严格的AB测试,在非公开的国家队奥数题面前,o1证明了自己的实力。
OpenAI下一代模型——o3,重磅诞生了!陶哲轩预言难住AI好几年的数学测试,它瞬间破解,编程水平位于全球前200,在ARC-AGI基准中更是惊人,打破所有AI纪录接近人类水平,离AGI更近一步。
不仅能推理,还能明确展示自己「推理逻辑」的大模型出现了。 OpenAI 的 12 天连续发布已近尾声,但它的热度显然已经被谷歌夺去了许多。从 Gemini 2.0 Flash 到 Veo 2 到今天的 Gemini 2.0 Flash Thinking,谷歌端上来的菜真是一道比一道香。
OpenAI 发布季第十一天,ChatGPT与Mac应用深度集成了—— 此次带来编程和写作两方面的更新。
12 月 18 日,OpenAI 发布季第十天,OpenAI 上线了 ChatGPT 的电话联系方式:1-800-CHATGPT(1-800-242-8478),美国用户每月可拨打该号码享受 15 分钟的免费通话。
OpenAI宕机因Kubernetes监控服务过载,承诺改进排障及预防措施。
视频生成领先 OpenAI 了?
ChatGPT 的横空出世,捧红了 Speak 以及一众出海的 AI Tutor 产品,同时杀死了没有及时“拥抱”AI 的教育巨头。如果 OpenAI 再向教育方向集中“开火”,又会发生什么呢?
Ilya Sutskever(前 OpenAI 联合创始人兼首席科学家)在前几天召开的 NeurIPS 会议上表示,大模型的预训练已经走到了尽头。而 Noam Brown(OpenAI 研究员,曾带领团队开发出在德州扑克中战胜职业选手的 AI 系统 Pluribus)在近期关于 OpenAI O1 发布的采访中提到,提升 Test-Time Compute 是提升大模型答案质量的关键。
继本月初马斯克向法院申请禁令阻止 OpenAI 转型营利性组织,Meta 近日也向加州总检察长 Rob Bonta 发出一封信,呼吁阻止 OpenAI 将其结构转变为营利性公司。